预训练模型相关论文
近年来随着深度学习技术的不断革新,预训练模型在自然语言处理中的应用也越来越广泛,关系抽取不再是单纯地依赖传统的流水线方法。预......
随着深度学习技术在人工智能领域的应用逐渐广泛,基于深度学习的文本生成领域的研究也变得逐渐热门。特别是故事结尾生成任务,作为......
文本分类任务通常依赖足量的标注数据,针对低资源场景下的分类模型在小样本上的过拟合问题,提出了一种基于提示学习的文本分类方法(BE......
随着信息技术的迅速发展,各种各样的应用软件已经融入到人们的工作与生活中,人们对于软件功能的需求也在日益增多。开发一套符合用......
随着移动互联网的快速发展,不同种类的媒体数据在互联网上迅速增长,如何快速高效地检索不同模态数据成为了人们关心的问题。目前,预训......
海量电子病历(Electronic Medical Record,EMR)数据是支撑医疗智能化研究的重要原料,然而电子病历文本数据的半结构化甚至无结构化特......
近年来深度学习在计算机视觉(CV)和自然语言处理(NLP)等单模态领域都取得了十分优异的性能.随着技术的发展,多模态学习的重要性和必要......
本文基于深度学习框架及自然语言处理,将政企类文本智能分类过程中的文本预处理、模型构建、分类效果比较等环节进行了实现与分析。......
以往的多模态方面级情感分析方法只利用预训练模型的一般文本和图片表示,对方面和观点词相关性的识别不敏感,且不能动态获取图片信息......
随着深度学习的发展,基于深度学习的命名实体识别抽取过程中,作为基础步骤的预训练模型也愈发受到重视。中文预训练语言模型能够更好......
【目的】对中文脑卒中电子病历特点进行分析,制定其命名实体标注规范,构建脑卒中专病的电子病历命名实体语料库,并借助预训练模型......
随着科技的快速发展,人们通过手机、电脑等电子设备获取新闻的方式多种多样,这些新闻通常以文本的形式存在于我们的日常生活当中,......
基于用户评论数据,本文对电商平台中搬家行业的用户满意度进行了研究。首先,对评论数据进行分词并词频统计,根据高频词汇和专家经验,确......
近年来深度学习的技术得到了广泛的应用与发展,也自然而然的应用在了自然语言处理的任务中,随之产生的预训练模型也因此得到了更为......
一个法律案件的裁判文书通常很长,而且法律术语很多,一般人很难理解,即使专业人士也要花许多时间才能理解。因此,有必要对法律案件......
Windows系统作为目前互联网上使用量最大的操作系统,提供和承载了海量的信息与服务,但是该系统下大量的恶意软件攻击给人们的信息......
机器问答是通过自然语言处理技术,使机器可以理解人们用自然语言提交的问题,同时并对问题做出响应回答。针对机器问答进行研究,采用了......
当前知名国内外公司麾下的社交网络上,每天都有大量的活跃用户,不断地产生新的内容,积累了大量的数据。新浪微博作为国内门户网站......
针对预训练模型在处理新闻这种长文本时会截断一部分文本,导致文本信息缺失的问题,提出一种在融入新闻标题信息基础上将TextRank算法......
近年来,随着人工智能技术在各行各业的应用,针对互联网中用户评论的情感分析已经成为了一个重要的研究课题。在提高产品质量,辅助......
与传统的机器学习模型相比,深度学习模型试图模仿人的学习思路,通过计算机自动进行海量数据的特征提取工作。文本分类是自然语言处理......
文本语义匹配是很多自然语言处理任务的基础.在很多场景中都需要文本语义匹配技术,如搜索、问答系统等.在实际运用场景中,对文本语......
为了解决汽车生产设备故障领域中文命名实体识别存在实体类别复杂、传统词向量无法解决一词多义等问题,本文提出一种基于BERT的汽车......
本文主要针对酒店领域的评论信息进行情感分析,研究用户对于酒店配置、服务等方面的态度,以便为酒店提高个性化服务质量提供一定的......
针对低资源语言缺少标签数据,而无法使用现有成熟的深度学习方法进行命名实体识别(NER)的问题,提出基于句级别对抗生成网络的跨语言命......
维吾尔语属于低资源语言又属于黏着性语言,在很长一段时间都缺少足够的语料来训练维吾尔语预训练模型,造成维吾尔语无法像中文那样基......
随着社交媒体和电子商务的迅速普及,用户在使用中产生了大量社交媒体文本和在线评论数据。分析和挖掘这些评论文本,可以为政府、企......
行业人物命名实体识别是为了从行业人物语料中抽取出有效的实体信息,是深度挖掘行业人物信息资源的基础性和关键性任务。但主流的命......
股票停牌是基于提高信息披露程度、抑制股票剧烈波动、消除信息不对称等目的所采取的机制,但个股的停牌行为存在随意性以及其复牌时......
伴随着视频流媒体技术的快速发展,各类视频服务已经成为人们日常生活中不可或缺的一部分。在最终呈现的视觉效果被观察者接收到之......
在自然语言处理领域,谷歌提出Transformer模型之后,以生成式预训练模型(Generative Pre-Training,GPT)和深度双向预训练语言模型(Bidi......
互联网时代的文本类数据管理的关键在于高效的信息检索、深度的信息挖掘以及自然语言处理。文本情感分类作为这些技术的一个重要环......
随着移动互联网的兴起,人们的衣食住行都与互联网全方位紧密联系起来。微博、微信、论坛等社交媒体的兴起,越来越多的网民愿意在网......
互联网技术的发展已逐渐改变了人们获取信息的方式,如何从非结构化文本信息中获取关键信息以构建知识图谱面临巨大的挑战。作为知......
在拥有大规模平行语料库的通用领域,神经机器翻译往往表现出色。然而,一些特定领域如生物医学、军事外交等专业性强的平行语料库规......
随着信息技术的快速发展,互联网中的文本信息呈爆炸式增长,导致了信息过载的现象,对大量的文本信息进行高效且准确地分类能够很好......
随着我国经济社会的发展、政府力量的介入,我国的期货交易市场逐渐步入正轨,期货趋势预测也受到越来越多民众和学者的关注。现有基......
关键词表征了文本的主题,是文本概念和主题的凝练。通过关键词,读者可以快速了解文档表达的主旨和思想,从而提升信息检索效率;此外,关键......
文本分类是自然语言处理领域中一个经典而又重要的任务。现有的大多文本分类方法都侧重于文本表示,然后使用机器学习算法或深度学......
随着互联网的不断发展,网民的数量逐渐增多,网络信息也呈爆炸式增长。这些信息基于用户的真实体验,蕴含着巨大的价值。目前可以使......
事件抽取是指从自然语言文本中抽取其中包含的结构化事件信息的任务。事件抽取任务按照抽取目标是否限定为特定领域的事件,可以分......
随着人工智能技术的发展,许多领域都出现了人工智能与传统行业的深度融合,诞生出了各种改变人们日常生活的应用。医疗作为与民生密......
随着近几年来自然语言处理技术的迅猛发展,人工智能已经渗透到我们生活的方方面面,各种各样的人工智能产品出现在市场上,人们也逐......